ChatGPT-4o ha fornito consulenza completa e soddisfacente a pazienti con malattia oculare tiroidea, ed è stato in grado di interpretare in maniera corretta immagini per la diagnosi, indicando quindi un buon potenziale per migliorare l’efficienza della pratica clinica. Questo è quanto riferisce uno studio pubblicato su Frontiers in Medicine, e diretto da Yue Wang, del Changzheng Hospital of Naval Medical University, Shanghai, Cina.
“L’emergere di chatbot Large Language Model (LLM), come ChatGPT, sembra promettente per migliorare la pratica sanitaria. La consulenza online, la diagnosi preliminare accurata e gli sforzi clinici sono di fondamentale importanza per il sistema di gestione orientato al paziente” affermano gli autori.
Per approfondire la situazione, i ricercatori hanno voluto valutare le prestazioni di ChatGPT nella consulenza sulla malattia oculare tiroidea (TED) e sulla diagnosi preliminare basata sulle immagini in una lingua diversa dall’inglese. Gli esperti hanno ottenuto richieste cliniche frequenti da una pubblicazione basata su consulenze ai pazienti, intitolata A Comprehensive Collection of Thyroid Eye Disease Knowledge. Inoltre, hanno raccolto immagini facciali e di tomografia computerizzata (TC) da 16 pazienti con una diagnosi definitiva di malattia oculare tiroidea. Le richieste sulla consulenza e sulla diagnosi preliminare sono state poste a ChatGPT utilizzando una nuova chat per ogni domanda. Le risposte alle domande date da ChatGPT-4, ChatGPT-4o e da un oculista esperto sono state raccolte e sono state valutate da pazienti e oculisti su quattro ambiti, ovvero accuratezza, completezza, concisione e soddisfazione.
Per quanto riguarda le domande comuni di consultazione TED, ChatGPT-4o ha fornito informazioni più accurate con coerenza logica, aderendo a un formato strutturato di definizione della malattia, sezioni dettagliate e conclusioni riassunte. In particolare, le risposte generate da ChatGPT-4o sono state valutate come migliori di quelle di ChatGPT-4 e dell’oculista esperto, per accuratezza, completezza, concisione e soddisfazione. Le caratteristiche dei valutatori, le variabili di risposta e altri punteggi di qualità sono stati correlati con i livelli di soddisfazione complessivi. Sulla base di diverse immagini facciali, ChatGPT-4 non è riuscito a fare diagnosi due volte a causa della mancanza di sintomi caratteristici o di una storia medica completa, mentre ChatGPT-4o ha identificato accuratamente le condizioni patologiche nel 31,25% dei casi. Inoltre, in combinazione con le immagini TC, ChatGPT-4o ha funzionato in modo comparabile all’oculista esperto in termini di accuratezza della diagnosi. “Bisogna comunque considerare che ci possono essere problemi nella gestione della disinformazione e nei permessi legali, che richiedono ulteriori indagini nella pratica clinica” concludono gli autori.
Front Med (Lausanne). 2025 Feb 18:12:1546706. doi: 10.3389/fmed.2025.1546706. eCollection 2025.


